Представлено сравнение дискретных скрытых марковских моделей и свёрточных нейронных сетей для классификации изображений. После разбивки изображений на части целесообразно получить векторы, которые представляют локальные визуальные структуры, одновременно определяющие изображения глобально через пространственную последовательность. С использованием методов кластеризации создается алфавит из указанных векторов, а затем конструируются последовательности символов, которые описывают статистические модели, соответствующие классам изображений. Скрытые марковские модели в сочетании с методами квантования могут обрабатывать шум и искажения в наблюдениях для решения проблем компьютерного зрения, таких как классификация изображений с изменением освещения и перспективы.
Протестированы архитектуры, основанные на трех, шести и девяти скрытых состояниях, в пользу скорости обнаружения и низкого использования памяти. Также были протестированы два типа ансамблевых моделей. Точность предлагаемого метода была оценена с помощью общедоступных данных; полученные результаты оказались сравнимы с известными оценками при использовании тонко настроенных свёрточных нейронных сетей, но требовали значительно меньших вычислительных ресурсов. Результат представляет интерес при разработке мобильных роботов с вычислительными устройствами, имеющими ограниченное время автономной работы, но требующими способности обнаруживать и добавлять новые объекты в свои системы классификации.
Отсутствие достаточного количества данных шепотной речи для обучения является серьезной проблемой для современных систем автоматического распознавания речи (АРР). Из-за большого акустического различия между обычной и шепотной речью АРР системы значительно снижают производительность при обработке шепота.
В статье приведен анализ подходов к распознаванию нейтральной и шепотной речи на основе традиционных скрытых марковских моделей (СММ) для дикторозависимых (SD) и дикторонезависимых (SI) случаев. Особое внимание уделяется распознаванию шепотной речи с использованием нейтральной речи на этапе обучения (сценарий N/W). Система АРР разработана для распознавания изолированных слов из базы данных (Whi-Spe), включающей пары слов реально произнесенной речи нейтрально и шепотом. В сценарии N/W увеличение надежности достигается с применением предлагаемого частотного преобразования, изначально разработанного для сжатия и декомпрессии речевого сигнала в цифровых телекоммуникационных системах. Вместе с тем сохраняются хорошие показатели в распознавании нейтральной речи.
По сравнению с базовой моделью распознавания с применением Мел-частотных кепстральных коэффициентов (MFCC) точность распознавания слов с использованием кепстральных коэффициентов, полученных с помощью предложенного частотного деформирования (обозначаемого как μFCC), улучшена на 7,36% (SD) и 3,44% (SI) в абсолютных значениях. Кроме того, F-мера (гармоническое среднее значение точности и полноты) для векторов признаков μFCC увеличивается на 6,90% (SD) и 3,59 %(SI). Статистические тесты подтверждают значимость достигнутого улучшения точности распознавания.
Скрытые марковские модели, байесовские сети и другие вероятностные графические модели зарекомендовали себя как одно из наиболее эффективных средств представления знаний с неопределенностью с активно развивающимся теоретическим и алгоритмическим аппаратом средств машинного обучения и нашли множество приложений в распознавании речи, обработке сигналов, биоинформатике, математической лингвистике, компьютерной криминалистике и пр. В статье предложен алгоритм декодирования последовательности скрытых состояний для бинарных линейных по структуре скрытых марковских моделей, представленных в виде алгебраических байесовских сетей, и доказана его корректность. Приведённый метод дополняет набор средств работы с такими моделями.
В статье предлагается порождающая графическая вероятностная модель со скрытыми состояниями на основе нелинейных главных многообразий, заданных в виде сетки узлов, для решения задачи классификации временных последовательностей. В качестве метода аппроксимации обучающих данных сеткой узлов использован алгоритм самоорганизующихся карт Кохонена. Модель представлена в виде фактор-графа с описанием применяемых фактор-функций. Разработан метод обучения и вероятностного вывода на предлагаемой модели. Проведена оценка качества классификации предлагаемой модели в сравнении с существующими моделями (HMM, HCRF) на различных наборах данных из репозитория UCI, в том числе проведена сравнительная оценка при малом количестве обучающих данных.
Для моделирования различных процессов в таких областях как биоинформатика, распознавание речи, машинный перевод активно используются скрытые марковские модели (СММ). Алгебраические байесовские сети (АБС) являются активно развивающимся аппаратом с широкими возможностями. Цель данной работы — представление более широкого класса скрытых марковских моделей с помощью алгебраических байесовских сетей, чем в более ранних исследованиях. Предложено представление линейной по структуре СММ при помощи АБС и показана его корректность с точки зрения эквивалентности вероятностных семантик.
Цель статьи — познакомить читателя с современным состоянием дел в области автоматического анализа музыкальной гармонии. Мотивацией для исследований в этой области может являться создание автоматических систем рекомендации музыки, ориентированных на содержание (наподобие Pandora, но без ручного труда экспертов-музыковедов). Основное внимание уделено графическим вероятностным моделям как одному из наиболее перспективных подходов, но описываются и альтернативные методы. Рассмотрены работы, использующие марковские цепи, скрытые марковские модели, многоуровневые графические модели. Приведены как работы, моделирующие только гармонию — последовательности аккордов, в некоторых случаях и тональность, — так и работы, включающие в себя информацию о структуре анализируемого произведения (ритмической, голосовой).
Скрытые марковские модели (СММ) и алгебраические байесовские сети (АБС) представляют собой вероятностные графические модели, а потому во многом похожи. СММ получила широкое применение, в то время как АБС пока не столь распространена, однако ее аппарат позволяет моделировать и решать задачи СММ. Цель работы — решить первую задачу скрытых марковских моделей при помощи апостериорного вывода АБС. В статье предложен алгоритм для оценки вероятности наблюдаемой последовательности в бинарных линейных по структуре СММ с помощью апостериорного вывода АБС.
Для моделирования различных процессов в таких областях, как распознавание речи, теория информации, машинный перевод, молекулярная биология, широко используются вероятностно-графические модели в том числе скрытые марковские модели и байесовские сети. Цель данной работы — исследовать взаимосвязь между скрытой марковской моделью и алгебраической байесовской сетью. Предложен алгоритм представления бинарной линейной по структуре скрытых марковских моделей в виде алгебраических байесовских сетей. Доказана теорема о совпадении вероятностных семантик скрытых марковских моделей и алгебраических байесовских сетей.
1 - 8 из 8 результатов